智能论文笔记

Are You Comfortable Now: Deep Learning the Temporal Variation in Thermal Comfort in Winters

Betty Lala , Srikant Manas Kala , Anmol Rastogi , Kunal Dahiya , Aya Hagishima

分类：机器学习 | 人工智能

2022-08-20

智能建筑中的室内热舒适对乘员的健康和表现有重大影响。因此，机器学习（ML）越来越多地用于解决与室内热舒适的挑战。热舒适感的时间变化是调节居住者福祉和能耗的重要问题。但是，在大多数基于ML的热舒适研究中，不考虑时间中的时间方面，例如一天中的时间，昼夜节律和室外温度。这项工作解决了这些问题。它研究了昼夜节律和室外温度对ML模型的预测准确性和分类性能的影响。数据是通过在14个教室中进行的长达一个月的实地实验收集的，其中512名小学生。四个热舒适度指标被认为是深神经网络的输出，并支持数据集的向量机模型。时间变异性对学童舒适性的影响通过“一天中的时间”分析显示。预测准确性的时间差异已显示（多达80％）。此外，我们表明室外温度（随时间变化）对热舒适模型的预测性能产生了积极影响高达30％。时空环境的重要性通过对比的是微观级别（特定于位置）和宏观级别（整个城市的6个位置）的重要性。这项工作的最重要发现是，对于多种热舒适度指标，显示了预测准确性的明确提高，而天空中的时间和天空照明则有所增加。

translated by 谷歌翻译

Building Matters: Spatial Variability in Machine Learning Based Thermal Comfort Prediction in Winters

Betty Lala , Srikant Manas Kala , Anmol Rastogi , Kunal Dahiya , Hirozumi Yamaguchi , Aya Hagishima

分类：机器学习

2022-06-28

室内环境中的热舒适感会对乘员的健康，福祉和表现产生巨大影响。鉴于对能源效率和实现智能建筑的关注，机器学习（ML）越来越多地用于数据驱动的热舒适度（TC）预测。通常，提出了用于空调或HVAC通风建筑物的基于ML的解决方案，这些模型主要是为成年人设计的。另一方面，在大多数国家 /地区，自然通风（NV）的建筑物是常态。它们也是节能和长期可持续性目标的理想选择。但是，NV建筑物的室内环境缺乏热调节，并且在空间环境中差异很大。这些因素使TC预测极具挑战性。因此，确定建筑环境对TC模型性能的影响很重要。此外，需要研究跨不同NV室内空间的TC预测模型的概括能力。这项工作解决了这些问题。数据是通过在5个自然通风的学校建筑中进行的为期一个月的实地实验，涉及512名小学生。空间变异性对学生舒适度的影响通过预测准确性的变化（高达71％）来证明。还通过特征重要性的变化来证明建筑环境对TC预测的影响。此外，对儿童（我们的数据集）和成人（ASHRAE-II数据库）进行了模型性能的空间变异性比较分析。最后，评估了NV教室中热舒适模型的概括能力，并强调了主要挑战。

translated by 谷歌翻译

A Generalist Framework for Panoptic Segmentation of Images and Videos

Ting Chen , Lala Li , Saurabh Saxena , Geoffrey Hinton , David J. Fleet

分类：计算机视觉 | 人工智能 | 机器学习

2022-10-12

Panoptic segmentation assigns semantic and instance ID labels to every pixel of an image. As permutations of instance IDs are also valid solutions, the task requires learning of high-dimensional one-to-many mapping. As a result, state-of-the-art approaches use customized architectures and task-specific loss functions. We formulate panoptic segmentation as a discrete data generation problem, without relying on inductive bias of the task. A diffusion model based on analog bits is used to model panoptic masks, with a simple, generic architecture and loss function. By simply adding past predictions as a conditioning signal, our method is capable of modeling video (in a streaming setting) and thereby learns to track object instances automatically. With extensive experiments, we demonstrate that our generalist approach can perform competitively to state-of-the-art specialist methods in similar settings.

translated by 谷歌翻译

Efficient Methods for Natural Language Processing: A Survey

Marcos Treviso , Tianchu Ji , Ji-Ung Lee , Betty van Aken , Qingqing Cao , Manuel R. Ciosici , Michael Hassid , Kenneth Heafield , Sara Hooker , Pedro H. Martins

分类：自然语言处理

2022-08-31

从有限的资源中获得最大收益可以进步自然语言处理（NLP）研究和实践，同时保守资源。这些资源可能是数据，时间，存储或能源。NLP的最新工作从缩放率产生了有趣的结果。但是，仅使用比例来改善结果意味着资源消耗也会扩展。这种关系激发了对有效方法的研究，这些方法需要更少的资源才能获得相似的结果。这项调查涉及NLP效率的方法和发现，旨在指导该领域的新研究人员并激发新方法的发展。

translated by 谷歌翻译

Cross-Lingual Knowledge Transfer for Clinical Phenotyping

Jens-Michalis Papaioannou , Paul Grundmann , Betty van Aken , Athanasios Samaras , Ilias Kyparissidis , George Giannakoulas , Felix Gers , Alexander Löser

分类：自然语言处理

2022-08-03

临床表型可以从患者记录中自动提取临床状况，这可能对全球医生和诊所有益。但是，当前的最新模型主要适用于用英语编写的临床笔记。因此，我们研究了跨语化知识转移策略，以针对不使用英语并且有少量可用数据的诊所执行此任务。我们评估了希腊和西班牙诊所的这些策略，利用来自心脏病学，肿瘤学和ICU等不同临床领域的临床笔记。我们的结果揭示了两种策略，这些策略优于最先进的方法：基于翻译的方法，结合了域的编码器和跨语性编码器以及适配器。我们发现，这些策略在对稀有表型进行分类方面表现特别好，我们建议在哪种情况下更喜欢哪种方法。我们的结果表明，使用多语言数据总体可以改善临床表型模型，并可以补偿数据稀疏性。

translated by 谷歌翻译

Betty: An Automatic Differentiation Library for Multilevel Optimization

Sang Keun Choe , Willie Neiswanger , Pengtao Xie , Eric Xing

分类：机器学习 | 人工智能

2022-07-05

多级优化已被广泛用作无数机器学习问题的数学基础，例如超参数优化，元学习和增强学习，仅举几例。尽管如此，实施多级优化程序通常需要在数学和编程方面的专业知识，这在该领域的研究都阻碍了研究。我们通过引入贝蒂（Betty）（用于基于梯度的多级优化的高级软件库）迈出了缩小这一差距的第一步。为此，我们基于对多级优化作为数据流图的新解释开发自动分化过程。我们进一步将多级优化的主要组成部分作为Python类，以实现简单，模块化和可维护的编程。我们从经验上证明，Betty可以用作一系列多级优化程序的高级编程接口，同时观察到测试准确性的提高11 \％，GPU存储器使用率下降14 \％，而20 \％降低了。在多个基准上的现有实现的墙壁时间。该代码可从http://github.com/leopard-ai/betty获得。

translated by 谷歌翻译

A Unified Sequence Interface for Vision Tasks

Ting Chen , Saurabh Saxena , Lala Li , Tsung-Yi Lin , David J. Fleet , Geoffrey Hinton

分类：计算机视觉 | 自然语言处理 | 机器学习

2022-06-15

尽管语言任务自然而然地以单个，统一的建模框架（即生成代币序列）表示，但在计算机视觉中并非如此。结果，对于不同的视力任务，不同的架构和损失功能的扩散。在这项工作中，我们表明，如果根据共享像素到序列界面进行配制，也可以统一一组“核心”计算机视觉任务。我们专注于四个任务，即对象检测，实例分割，关键点检测和图像字幕，所有这些任务都具有各种类型的输出，例如边界框或密集的掩码。尽管如此，通过将每个任务的输出作为具有统一界面的离散令牌的顺序，我们表明可以在所有这些任务上训练具有单个模型体系结构和损失功能的神经网络，而没有特定于任务的自定义。为了解决特定的任务，我们使用一个简短的提示作为任务说明，序列输出适应提示，以便它可以产生特定于任务的输出。我们表明，与成熟的特定任务模型相比，这种模型可以实现竞争性能。

translated by 谷歌翻译

What Do You See in this Patient? Behavioral Testing of Clinical NLP Models

Betty van Aken , Sebastian Herrmann , Alexander Löser

分类：自然语言处理 | 机器学习

2021-11-30

基于临床票据的决策支持系统有可能通过指向监督风险的医生来改善患者护理。预测患者的结果是这种系统的重要组成部分，其中利用深神经网络的使用表明了有希望的结果。然而，这些网络学到的模式大多是不透明的，之前的工作揭示了关于非预期偏差的再现的缺陷。因此，我们引入了一个可扩展的测试框架，评估了关于输入变化的临床结果模型的行为。该框架有助于了解学习模式及其对模型决策的影响。在这项工作中，我们将其应用于对患者特征性别，年龄和种族的行为变化。我们对三个目前的临床NLP模型的评估表明了这些特征对模型决策的具体影响。他们表明，即使在相同的数据上微调并且据称最佳的模型并不总是学习最卓越的模式的模式，模型行为也变得剧烈变化。

translated by 谷歌翻译

MultiSubs: A Large-scale Multimodal and Multilingual Dataset

Josiah Wang , Pranava Madhyastha , Josiel Figueiredo , Chiraag Lala , Lucia Specia

分类：自然语言处理

2021-03-02

本文介绍了一个大规模的多模式和多语言数据集，该数据集旨在促进在语言中的上下文使用中对图像进行接地的研究。数据集由选择明确说明在电影字幕句子中表达的概念的图像组成。数据集是一个宝贵的资源，因为（i）图像与文本片段一致，而不是整个句子；（ii）对于文本片段和句子，可以使用多个图像；（iii）这些句子是自由形式和现实世界的；（iv）平行文本是多语言的。我们为人类设置了一个填充游戏，以评估数据集的自动图像选择过程的质量。我们在两个自动任务上显示了数据集的实用程序：（i）填充填充；（ii）词汇翻译。人类评估和自动模型的结果表明，图像可以是文本上下文的有用补充。该数据集将受益于单词视觉基础的研究，尤其是在自由形式句子的背景下，可以从https://doi.org/10.5281/zenodo.5034604获得创意常识许可。

translated by 谷歌翻译